개인정보 보호를 위한 비밀번호 변경안내 주기적인 비밀번호 변경으로 개인정보를 지켜주세요.
안전한 개인정보 보호를 위해 3개월마다 비밀번호를 변경해주세요.
※ 비밀번호는 마이페이지에서도 변경 가능합니다.
30일간 보이지 않기
  • 전체
  • 일반뉴스
  • 오피니언
  • 메타TV
초점

전문의 진단율 연전연패…AI가 바꿀 임상 환경은?

메디칼타임즈=최선 기자최근 몇 년 동안 인공지능(AI) 기술은 의료 분야에서 빠르게 발전하며 임상 의사들의 업무에 큰 변화를 예고하고 있다. 영상 진단 영역에서의 활용이 두드러지지만 심전도 신호를 기반으로 한 다양한 질환 예측 인공지능도 상용화 단계를 넘어선 만큼 인공지능의 보편적 활용은 예정된 미래라는 것.초기 연구가 인공지능을 임상 영역에서 활용 가능할 정도의 신뢰성을 갖췄는지를 확인하는 탐색 연구가 주를 이뤘다면 현재는 가능성 탐구는 끝났다는 평이다. 실제 인간이 수행한 검진 데이터를 기반으로 학습 시켰을 때 비슷하거나 더 나은 수준의 진단 능력을 보이면서 연구 방향도 전문의와의 직접 대결 양상으로 흐르고 있다.벌써부터 일부 연구에선 인공지능이 전문의를 앞선 것으로 나타난 상황. 논의의 주제는 고도화된 인공지능이 전문의를 대체할 수 있냐는 것으로 변모하고 있다. 기술 만능주의를 경계하는 목소리 역시 만만치 않다. 의료사고에 있어 책임소재가 불분명해 어디까지나 의료진 판단의 보조 수단으로 활용될 뿐 전문가를 대체한다는 건 지나친 확대해석이라는 것이다.최근 연구 흐름은 어떨까. 인공지능이 과연 전문의들을 대체할 정도의 양질의 판단을 내놓는 것일까. 인공지능을 개발하는 의료진, 인공지능을 활용해 스마트병원을 구축한 병원장 등에게 인공지능을 둘러싼 미래에 대해 물었다.▲가능성 탐색에서 인공지능 우월론으로최근 인공지능의 연구 동향은 전문의와의 직접 대결 양상으로 변모하고 있다. 누적된 학습을 통해 인공지능이 고도화되면서 실제 성능을 확인하기 위해선 필드 테스트에 준하는 인간과의 직접 비교가 불가피하기 때문. 그 결과는 어떨까.인공지능 학습이 고도화되면서 인공지능과 전문의간 진단 정확도를 직접 비교하는 연구가 활성화되고 있다(pubmed 캡쳐).이달 20일 공개된 국내 현직 의대 교수가 만든 심전도(ECG) 분석 인공지능은 고칼륨혈증 진단 정확도와 평가자간 일치율 등에서 전문의 수준을 앞질렀다.분당서울대병원 응급의학과 김중희 교수가 이끄는 다기관 연구진은 고칼륨혈증으로 진단된 환자 64명과 그렇지 않은 환자 61명 등 총 125명을 대상으로 ECG 버디와 응급의학과 전문의 5명간 진단과 분석 결과를 비교했다.분석 결과 ECG 버디는 고칼륨혈증 진단에 있어 곡선하면적(AUCROC)가 0.902를 기록했다. 곡선하면적이 1에 가까울 수록 정확하다는 의미로 응급의학과 전문의 5명의 평균 곡선하면적은 0.662로 상대적으로 낮았다. 정확도 면에서 인공지능 어플리케이션에 비해 크게 떨어졌다는 의미다.다른 지표에서도 ECG 버디는 민감도 0.797, 특이도 0.934, 음성 예측도 0.815, 양성 예측도 0.927를 보인 반면 응급의학과 전문의는 평균 민감도 0.203, 특이도 0.934, 음성 예측도 0.527, 양성 예측도 0.765로 인공지능에 비해 뒤쳐졌다.직접 비교 연구는 해외에서도 활성화되고 있다.이달 공개된 덴마크 방사선연구소 카밀라 판듀로 닐슨 등이 진행한 연구(DOI:10.1080/0284186X.2023.2256958)는 두경부암 환자에서 인공지능과 종양 전문의가 고위험 장기 윤곽을 얼마나 정확하게 잡아내는지 비교했다.덴마크 두경부암 그룹(DAHANCA) 임상 35에 참여한 63명의 환자는 지역 DAHANCA 센터의 CT와 양성자 센터의 CT 데이터를 가지고 있었다.nnU-Net을 기반으로 하는 전국 단위 신경망을 사용해 각 환자에 대한 두 스캔 모두에서 위험 장기(Organ at risk, OAR)의 윤곽을 처리했다. 일치도는 의료 영상 분석에서 분할 결과의 정확성을 평가하는 DSC 점수와 평균 표면 거리(MSD)를 사용해 계산했다.분석 결과 인공지능의 윤곽은 종양 전문의보다 훨씬 나은 일관성을 보였다. DSC의 중앙값 및 사분위간 범위는 인공지능 및 전문의의 경우 각각 0.85 대 0.68, MSD의 중앙값 및 사분위간 범위는 각각 0.9mm 대 1.9mm였다.10월 공개된 인공지능 대 외과의사의 응급 수술 위험도 예측 비교 연구(DOI:10.1097/TA.0000000000004030)에서도 인공지능이 대부분 항목에서 더 정확했다.매사추세츠 종합병원 응급의학과 모하메드 모헤브 등 연구진은 스마트폰 기반의 응급 수술 위험도 예측 인공지능(Predictive Optimal Tree in Emergency Surgery Risk, POTTER)과 외과의사의 수술 위험 추정치를 비교하는 연구를 진행했다.2018년 5월부터 2019년 5월 사이에 대형 4차 진료소에서 EGS를 받은 총 150명의 환자가 수술 후 30일 결과(사망률, 패혈성 쇼크, 인공호흡기 필요, 수혈이 필요한 출혈, 폐렴)에 대해 전향적으로 추적 관찰했다.스마트폰 기반의 응급 수술 위험도 예측 인공지능(POTTER)의 수술 위험 추정치는 외과의사를 상회했다.분석 결과 인공지능 POTTER는 패혈성 쇼크(AUC: 0.816 대 0.820)를 제외한 모든 결과에서 전문의를 앞질렀다.사망률 AUC는 인공지능이 0.880, 전문의가 0.841이었고 인공호흡기 의존성은 각각 0.928 대 0.833, 출혈은 0.832 대 0.735, 폐렴은 0.837 대 0.753였다.연구진은 "인공지능 위험도 계산기 POTTER는 응급실 환자의 수술 후 사망률과 결과를 예측하는 데 있어 외과의사의 판단을 능가했다"며 "이를 보조로 사용했을 때 외과의사 개인의 위험도 예측을 향상시켰다는 점에서 수술 전 환자를 상담할 때 진료 보조 툴로 유용할 수 있다"고 결론내렸다.29일 종료된 북미영상의학회 연례회의(RSNA 2023)에서도 고도화된 자폐증 진단 인공지능이 이목을 집중시킨 바 있다.24~48개월 사이 소아 226명(자폐증 진단 126명, 정상 100명)에 대한 진단 결과 인공지능은 자기공명영상(DT-MRI)만으로 자폐증을 98%의 정확도로 잡아냈다.인공지능이 지속적으로 승전보를 울린 가운데 국내에서도 최대 규모의 인공지능 대 응급의학과 전문의의 판독 결과를 직접 비교하는 전향적 임상 연구가 진행되고 있다.심전도 AI 분석업체 메디컬에이아이는 심전도 기반 심근경색 진단율 비교 임상 결과를 내년 상반기 내놓는다는 계획. 2022년도 3월부터 진행된 임상은 전국 18개 응급실에서 가슴 통증으로 내원한 환자에 대한 인공지능과 전문의의 진단 정확도를 비교하도록 설계됐다.메디컬에이아이 관계자는 "기존 데이터를 가져와 후행적으로 분석한 것이 아닌 전향적 진행된 연구"라며 "국내에서 최대 규모 임상일뿐 아니라 이 정도 인원이 참여한 것은 세계에서도 AI 관련 임상으로는 유례를 찾아보기 힘들다"고 말했다.이어 "참여 대상자 모집과 임상이 지난 달 마무리가 돼 현재 임상 결과 분석 작업에 들어간 상태"라며 "내년 1분기 쯤 연구 결과 공개가 예상되는데 최대한 연구 논문의 질을 끌어올려 유명 저널 게재를 목표로 하고 있다"고 밝혔다.▲AI 만능 아냐…임상 설계·변수 따라 성능 편차해외에서는 광범위한 연구가 누적되면서 여러 연구를 종합해 분석하는 메타분석의 단계까지 접어들었다.선종 및 용종 검출을 위한 대장내시경 인공지능의 성능 연구(DOI:10.1016/j.gie.2020.06.059)는 5개 무작위 대조 연구(4354명)를 메타분석했고, 내시경 영상에서 헬리코박터 파일로리 감염 예측을 위한 인공지능 진단검사 정확도 연구(DOI:10.2196/21983)는 RCT 8개(1719명), 상부 GI 병변 검출의 정확도 연구(DOI:10.1016/j.gie.2020.06.034)는 23개의 연구(96만 9318개 이미지)를 분석했다.이외에도 다양한 연구에서 인공지능의 진단 성능이 전문의를 앞서거나 최소한 동등한 수준으로 나왔지만 이에 대한 반론도 만만치 않다.인공지능의 진단 정확도의 비교 잣대인 임상 전문가의 '수준'에 따라 연구 결과가 혼재되는 등 임상 설계의 변수를 감안해야 한다는 것. 게다가 연구 성과물은 주로 인공지능이 최적의 성능을 나타내는 분야에서 진행됐기 때문에 이를 일반화시켜 인공지능은 만능이라는 공식을 세울 수 없다는 것이다.실제로 방사선 전공의와 인공지능의 흉부방사선 영상 판독 결과를 비교한 임상(DOI:10.1001/jamanetworkopen.2020.22779)에서 인공지능의 평균 이미지 기반 민감도 AUC는 0.716, 방사선 전공의는 0.720였고, 양성 예측도는 각각 0.730, 0.682, 특이도는 각각 0.980, 0.974로 평가 항목마다 다른 양상이 나타난다. 학습 데이터를 바꾼 경우 인공지능의 AUC 값은 0.807에서 0.772로 바뀌었다.프랑스 파리 호텔듀병원 방사선학과 마티외 코헨 등 연구진은 방사선 전문의와 인공지능간 손목 골절 검출 정확도를 비교한 연구(DOI:10.1007/s00330-022-09349-3)도 조건 변경에 따른 다른 결과 가능성이 제시된다.연구는 2017년 1월부터 2019년 12월 사이에 손목 외상을 입은 637명의 환자와 관련한 1917장의 X-ray 영상을 기반으로 아직 숙련되지 않은 초기 방사선 전문의와 인공지능이 각각 골절을 진단했다.선임 방사선 전문의들이 보고한 골절은 247명의 환자에서 총 318건이었는데 이에 대한 인공지능의 검출 민감도는 83%였고, 초기 방사선 전문의들은 76%였다. 다만 특이도는 두 그룹 모두 96%로 같았다.영상의학회 관계자는 "두 연구에서 인공지능의 비교 대상이 전공의나 비숙련 전문의로 설정됐지만 이를 전문의나 숙련된 전문의와의 비교로 바꾸었다면 충분히 다른 연구 결과가 나올 수도 있다"며 "적응증마다 무엇을 기준으로 판별할지, 판별의 가중치를 어떻게 할지 등 변수가 많아 단순히 인공지능과 인간 중 누가 더 뛰어나다는 식으로 말하기 어렵다"고 지적했다.▲AI가 의료진 대체한다? "진료 효율화 도구"인간과 인공지능의 직접 비교 임상이 활성화되면서 다른 방향의 접근도 활성화되고 있다. 바로 인공지능을 진단 보조 도구로 결합했을 때 임상 결과를 개선할 수 있는지 여부, 즉 대결이 아닌 협업의 관점이다.피부과 전문의의 흑색종 분류 정확도에 미치는 인공지능 효과 연구(DOI:10.2196/18091)에서 평균 민감도와 정확도는 인공지원 지원으로 크게 증가했다(59.4% 대 74.6%).이와 유사하게 CT를 통한 코뼈 골절 진단에 있어서의 인공지능 지원 연구는 인공지능 사용 시 민감도 94.00±3.17을 기록, 의료진의 독자적인 진단의 83.52±10.16을 상회했고 특이도(89.75±6.15, 77.55 ± 11.38) 및 AUC(0.92±0.04, 0.81±0.10)도 협업의 당위성을 설명했다.연구진은 "AI의 도움으로 1~5년 저숙련 또는 6~10년의 경력을 가진 전문의에서도 민감도, 특이도 및 AUC가 유의하게 향상됐다"며 "인공지능 모델은 코뼈 골절의 위치를 파악하기 위해 경험이 부족한 의사와 방사선사가 진단 성능을 개선하는 데 도움이 될 수 있다"고 결론내렸다.딥러닝 기반의 인공지능 알파고가 인간과의 대결에서 승리한 이후 오히려 인공지능 프로그램을 통한 기보 학습이 활발해진 것처럼 비슷한 형태의 협업 내지 학습이 임상 현장에서도 이뤄질 수 있다는 것.딥러닝 기반의 진단 모델보다는 진단 보조와 행정 업무 효율화 측면의 인공지능이 먼저 보편화될 것으로 전망된다.  은평성모병원이 세계 최초로 도입한 인공지능 음성인식 모바일 전자간호기록 플랫폼'Vobile ENR'.이런 인식을 반영하듯 의학한림원은 30일 의과대학 교육에 적용 가능한 인공지능 과정을 제안하기 위한 '의료 AI 교육과정 개발 가이드라인 및 모델' 공청회를 연다. 공청회 주요 논의 사항으로는 의학한림원의 연구진이 개발한 의료 인공지능 역량과 한국의과대학ㆍ의학전문대학원협회의 기본의학교육 졸업성과 연계 방안, 필수 및 선택 과목의 편성 기준 등이 포함돼 사실상 의료 영역에서의 인공지능 접목 및 활용이 필수 불가결한 요소로 자리잡았음을 시사했다.  심전도 분석 인공지능 SW를 개발한 권준명 메디컬에이아이 대표(심장학회 스마트헬스연구회 이사)는 "임상 현장에서의 인공지능 활용은 보편화되고 대중화되는 단계를 넘어 필수적인 보조 진단 기기로 자리 잡을 것으로 예상한다"며 "인공지능은 의료진의 합리적인 의사 결정을 도와주는 보조 도구이지 결코 경쟁자나 의료진의 대체자가 아니"라고 강조했다.필름 기반의 영상 이미지 자료가 디지털 시대로 변하며 PACS 시스템으로 통합된 것처럼 인공지능 진단툴은 시간 문제일뿐 임상의사결정지원시스템(CDSS)으로 융합될 수 있다는 게 전문가들의 판단.주로 딥러닝 기반으로 학습한 인공지능이 진단에 활용되는 반면 대규모 언어 모델 기반(LLM)의 인공지능은 자연어 처리를 통한 진단 보조와 행정 업무 효율화에 기여한다.진단 관련 인공지능은 다양한 적응증에 대한 신뢰도 확보 및 검증에 시간이 소요되는 만큼 효율화 측면에서의 인공지능이 먼저 임상 현장의 풍경을 바꿀 것으로 예상된다.올해 2월 은평성모병원은 세계 최초로 인공지능 음성인식 모바일 전자간호기록 플랫폼 'Vobile ENR'(Electronic Nursing Record)을 도입한 바 있다.배시현 병원장은 "스마트병원 구축의 핵심은 인공지능으로, 업무 효율화를 중심으로 한 인공지능이 먼저 대중화될 것으로 본다"며 "실제로 인공지능 음성인식 플랫폼을 도입한 결과 많은 직원들이 환영하고 있다"고 밝혔다.그는 "수기 입력없이 혈압과 맥박, 약 처방 확인 내역, 간호 기록 등을 말로 하면 자동으로 텍스트로 변환돼 입력이 된다"며 "이는 병원 시스템과 연결돼 있어 어디서든 말로 입력을 해도 다 기록이 되기 때문에 이제 손으로 쓰는 일은 보기 힘들어 졌다"고 말했다.이어 "처음 2개 병동으로 시작해서 지금은 6층부터 15층까지 다 인공지능 음성인식 플랫폼을 활용한다"며 "최근에도 일산 쪽 병원에서 참관 요청이 와 시연해주고 다양한 병원들이 벤치마킹하고 있어 이런 플랫폼 보급이 더 확대될 것"이라고 전망했다.
2023-11-30 00:23:30학술

"의료진 업무 줄여라"…임상 현장 AI 접목 시도 활발

메디칼타임즈=최선 기자스마트병원 시대를 열 핵심 키로 인공지능이 제시되고 있다. 연구의 규모가 커지고 고도화될 수록 인력에 의존하는 방식 대신 AI를 활용한 연구 효율화 방안이 보다 보편화될 것이란 게 전문가들의 진단이다.정보통신기술(ICT)을 활용해 의료 질을 향상시킨다는 '스마트병원' 개념이 인공지능(AI)과의 접목을 통해 서서히 구체화되고 있다.영상 판독문을 알아서 분류하고 의료영상 진단 오류를 탐지하는 것은 물론 타이핑 대신 음성으로 간단히 차트를 작성하는 등 단순하거나 반복적인 업무 부담을 AI가 대신해 의료진은 그만큼 환자의 진료에 더 집중할 수 있다는 것.19일 스위스그랜드호텔에서 개최된 대한의료인공지능학회 학술대회에서 의료 영역에서 인간의 판단 및 경험, 노동력에 의존해야 했던 부분의 업무 부담을 줄이기 위한 다양한 아이디어가 공유됐다.스마트병원 시대를 열 핵심 키로 지목된 것은 방대한 양의 데이터를 기반으로 학습된 대규모 언어 모델(LLM). 일련의 텍스트에서 의미를 추출하거나 추론하고 단어와 구문 간의 관계를 이해하기 때문에 일상 언어로 질문하거나 명령을 내려도 그 의미를 이해해 적절한 업무를 처리할 수 있다.일반인을 대상으로 상용화된 ChatGPT도 대규모 언어 모델을 사용하고 있지만 의료 영역에서는 전문 용어, 의학 용어, 축약어 등이 사용되고 질환별 환자 특성이 달라 각 의료기관, 전문과는 해당 특성에 맞는 방식의 LLM을 개발하거나 기존 LLM을 세부 조절해 적용하는 파인튜닝을 시도하고 있다.이날 학회에선 최근 연구 동향을 살필 수 있는 다양한 포스터 연구가 발표됐다. 주요 방향성은 AI 기반의 진단 보조와 행정 업무 자동화로 요약된다. AI 진단은 기업이 개발한 전문 SW가 여러 적응증에서 상용화됐고 일부는 비급여 항목으로 지정된 까닭에 학계 연구는 연구 효율화를 위한 업무 자동화 등에 초점을 맞췄다.삼성융합의과학원(SAIHST), 삼성서울병원 등이 진행한 응급실 의무기록지에 대한 개인정보 자동 삭제 방안 연구는 AI를 활용한 연구 효율화 방법론을 제시했다.최근 BERT와 GPT와 같은 언어모델의 등장으로 자연어 처리 연구가 많은 주목을 받고 있고 의료계에서도 문자 서술형(free-text) 의료데이터를 자연어 처리 기술로 분석하려는 시도가 급속도로 증가하고 있다.차원철 성균관의대 교수는 연구 효율화를 위한 AI 활용의 중요성에 대해 강조했다.문제는 개인정보 보호법으로 의무기록을 연구에 활용하기 위해서는 철저한 가명 처리가 필요해 많은 수요에도 불구하고 국내 의료데이터는 자연어처리 연구에 손쉽게 활용되기 어렵다는 점.의무기록 정보의 전문성으로 인해 의료진이 직접 개인정보에 해당하는 내용을 일일이 검토하고 가명 처리하는 번거로운 과정을 거쳐야 하는 실정이다.연구진은 이같은 한계점을 해결하기 위해 한국어 언어모델인 DistilKoBERT를 적용, 응급실 의무기록지 내 개인 정보를 자동으로 인식할 수 있는지 여부를 확인했다. DistilKoBERT 성능은 문맥을 이해하기 때문에 Rule-base 방식인 정규 표현식보다 개인정보를 더 잘 분류한다는 것이 연구진의 판단.차원철 성균관의대 교수(삼성서울병원 디지털혁신센터 센터장) 역시 '생성모델 범람의 시대 의료 인공지능의 나아갈 길' 발표를 통해 연구 효율화를 위한 AI 활용의 중요성을 언급한 바 있다.차 교수는 "의료 데이터를 연구에 활용하려고 하면 환자를 특정할 수 있는 수술 날짜나 수술명, 나이 등의 정보를 삭제하는 가명화, 비식별화가 필요하다"며 "이런 요소를 찾아서 삭제하는 일이 쉽지 않기 때문에 인력에 의존할 수밖에 없었다"고 말했다.그는 "무식해 보일 순 있지만 5천개 정도를 일일이 찾아서 삭제하기도 했다"며 "국가연구사업을 할 때는 3만개 정도의 자료를 해야 했기 때문에 인력에 의존할 수 없어 AI와 같은 다른 방향성을 고민하게 됐다"고 밝혔다.연구의 규모가 커지고 고도화될 수록 인력에 의존하는 방식은 더 이상 작동할 수 없다는 것. 이날 업무 효율화, 자동화에 초점을 맞춘 연구들이 공개된 것도 비슷한 맥락이다.서울의대 곽정원 연구팀은 한국어 의료 인공지능 개발을 위한 가상 의무기록지 생성 방법을 제시했다.의료 현장에 적합한 인공지능을 개발하기 위해 한국어 의료 분야에 특화된 언어 모델을 구축해야 하고, 이를 학습시키기 위해서는 방대한 양의 의무기록지 데이터가 필요하지만 개인정보 보호와 규제 등으로 인해 접근이 제한될 수 있다.이에 연구진은 충분한 양의 실제 의무기록지 데이터를 수집하는 것이 어려울 경우 적은 양의 실제 데이터를 유사한 가상 데이터 형태로 증강해 데이터 확보 문제를 해결하는 한국어 가상 의무기록지 생성 방법을 제시했다.이외에도 대규모 언어모델을 활용한 영상 판독문 레이블링 연구, 의료영상 진단 오류 탐지를 위한 인공지능 모델 개발, 시간의 흐름에 따른 응급실 내원 환자의 사망 예측 기계학습 모델 개발 및 검증, 소아 발열의 원인을 탐지하는 딥러닝 기반 스마트폰 앱 연구 등이 공개됐다.AI가 사실과 다른 내용을 창조해 제시하는 환각(hallucination) 현상은 의료 분야에서 AI의 활용을 제한하는 걸림돌로 작용한다. 서울대학교 의학정보학연구소 등이 참여한 연구팀은 생성형 AI를 사용해 갑상선 수술 기록에서 환각을 탐지하고 교정한 연구 결과를 제시했다.
2023-10-20 05:30:00학술
기획 창간 20주년 특별기획

신기루냐 신기술이냐…Chat GPT 등장에 분주한 의학계

메디칼타임즈=최선 기자"단일 주제에 최단 기간 이렇게 많은 관심이 집중된 건 처음입니다."2022년 11월 말 첫 등장한 대화형 인공지능 ChatGPT가 의료계 화두로 떠오른 건 올해 1월 미국 의사면허 시험(USMLE)을 통과했다는 소식이 알려지면서부터다. 인공지능이 체계화된 학습과 고도의 사고 능력, 전문성을 살피는 의사면허 시험을 통과한 것은 상징적인 사건이라는 게 전문가들의 평.  실제로 7월 2일 기준 논문검색 사이트 PubMed에 등록된 ChatGPT 관련 연구 논문은 총 723편으로 단기간 최대의 관심이 ChatGPT에 집중되고 있다고 해도 과언이 아니다. 산술적으로 계산하면 ChatGPT의 등장 이후 의료 영역 활용성과 접목 가능성을 살핀 연구는 한달에 100편 꼴로, 이는 단순한 흥미끌기용이 아닌 본격적인 의료 영역에서의 검증의 시험대에 올라섰음을 의미한다.이런 현상은 외국에 국한되지 않는다. 국내에서도 ChatGPT의 활용성을 검증한 논문이 출현하고 있는 데다가 각종 학술대회에서도 연구/논문 작성을 위한 최적화된 ChatGPT 활용 방법론 세션이 속속 등장하고 있다.1990년대 중후반부터 의학 연구에서도 의학통계 분석 프로그래밍 언어 SPSS 학습이 대중화된 것처럼 ChatGPT는 지나가는 한때의 유행으로 치부하기엔 기술적인 완성도가 상당해, 비슷한 맥락에서 "모르면 뒤쳐진다"는 평가가 나오고 있다.흥미로운 점은 주요 연구들이 인공지능을 두고 친구/적/혁명/바보(ChatGPT: friend or foe?, ChatGPT is fun, but not an author, ChatGPT fool scientists, ChatGPT: evolution or revolution?)와 같은 이분법적인 구도로 접근한다는 점.실제 ChatGPT를 써 본 의학자들은 평가는 어떨까. ChatGPT와 같은 인공지능 기술이 병원이나 의료 영역에서 다양한 방식으로 활용되는 것이 예정된 미래라면 과연 어떤 분야에서 어떻게 활용될 수 있을까. 전문가에게 미래 병의원의 ChatGPT 활용성에 대해 질의하자 다음과 같은 답변이 돌아왔다.-의료 진단 및 상담: ChatGPT는 환자들의 증상 및 의료 기록과 관련된 질문에 대답할 수 있습니다. 의사나 간호사가 바쁜 상황에서, ChatGPT는 환자들에게 기본적인 질문에 응답하거나 증상에 대한 일반적인 정보를 제공하는 역할을 수행할 수 있습니다. 또 ChatGPT는 환자들의 심리적인 문제나 스트레스에 대한 상담을 제공할 수도 있습니다.-의료 정보 제공: ChatGPT는 의료 정보를 제공하는데 활용될 수 있습니다. 환자들이 특정 질병이나 의료 절차에 대해 궁금한 사항이 있을 때, ChatGPT는 해당 정보를 제공하고 관련 자료나 추천을 할 수 있습니다. ChatGPT는 의료 용어나 의학적인 개념에 대한 설명을 담당해 환자들이 이해하기 쉽도록 도와줄 수 있습니다.-의료 연구 지원: ChatGPT는 의료 연구자들의 작업을 지원하는데 활용될 수 있습니다. 의료 연구에는 방대한 양의 데이터와 문헌 조사가 필요한데, ChatGPT는 이러한 작업을 자동화하거나 보조할 수 있습니다. 예를 들어 ChatGPT는 의료 문헌을 분석하고 연구 결과를 요약하거나 관련 연구 자료를 추천할 수 있습니다.-환자 모니터링: ChatGPT는 환자들의 건강 상태를 모니터링하는데 활용될 수 있습니다. ChatGPT를 통해 환자들은 의료진과 실시간으로 대화하며 건강 상태를 보고하고 조언을 받을 수 있습니다. ChatGPT는 환자들의 건강 데이터와 의료 기록을 분석해 변화나 이상 징후를 감지하고 조기 경보를 제공할 수 있습니다.-의료 교육: ChatGPT는 의료 교육에 활용될 수 있습니다. 의사들이나 의료 학생들에게 의료 지식을 가르치거나 의료 교육 자료를 제공하는데 사용될 수 있습니다. 또 ChatGPT는 환자 교육을 위해 의료 정보를 이해하기 쉽고 친근한 언어로 전달하는 역할을 수행할 수 있습니다.결론부터 말하자면 위 활용성에 대한 답변은 ChatGPT가 언급한 내용이다. 인공지능 답변의 영향을 배제하기 위해 전문가들의 취재를 마친 이후 같은 내용을 ChatGPT에 대해 질의했다. 흥미로운 점은 ChatGPT가 스스로 판단한 미래 병의원에서의 활용성은 놀라울 정도로 의료 전문가가 상상한 미래, 혹은 진행되고 있는 상용화 방향과 닮아있었다.7월 2일 기준 논문검색 사이트 PubMed에 등록된 ChatGPT 관련 연구 논문은 총 723편으로 매달 100여편씩 활용성을 검증이 지속되고 있다.현재 ChatGPT를 의료 영역에 접목하기 위해 시도하고 있는 의료기관들은 문진, 진료 결과 안내, 연구 지원과 같은 분야에서 우선적으로 ChatGPT를 활용하는 방향성으로 접근하고 있다. 행정, 단순 업무에 대한 활용을 시작으로 그 범위를 늘려간다는 것. 실제 전문가들에 대한 의견을 들어보자.▲신기루냐? 신기술이냐? "미래 환경 바꿀 키(key)"ChatGPT를 두고 친구/적/혁명/바보와 같이 극단적으로 평가가 엇갈리는 이유는 단순하다. 그간 의료계를 강타했던 빅데이터, AI, AR, VR, 블록체인 등 다양한 신기술들이 혁명은 커녕 활용성을 찾지 못해 신기루에 그쳤던 것. 양극단의 평가는 그 전철을 밟을 것이란 우려와 이번엔 다르다는 긍정론의 교차를 의미한다.대규모 수술 참관, 술기 반복 학습 등 교육 혁신으로 일컬어졌던 VR 시스템 및 메타버스는 불과 1년 전만해도 각종 의료기관이 앞다퉈 도입 소식을 알렸지만 현재는 메타버스를 활용한 교육 진행은 커녕 보도자료에서도 해당 단어가 자취를 감출 정도로 '한때 유행'으로 전락했다.메타버스는 새로운 정체성과 자아를 가진 캐릭터들이 모여 새로운 가상 공간을 창조하고 이용한다는 신기함이 있을지언정, "그래서 의료계에서 활용성은?"이란 질문 앞에 적절한 당위성을 제공하지 못했기 때문이다.ChatGPT도 한때 유행에 그칠까. 아니면 미래 환경을 바꿀 핵심일까. 조치흠 대한의료정보학회 조직위원장(계명대 동산의료원장)의 판단은 후자에 가깝다.조 위원장은 "ChatGPT는 스마트병원을 완성시킬 핵심 키"라며 "2019년 이전 개원한 동산병원도 스마트병원을 만들기 위해 원무 자동화 시스템, 웨어러블 디바이스, 로봇 물류 시스템, 실시간 감염추적관리 시스템, 보이스 채팅 등을 도입하고자 노력하고 있다"고 말했다.그는 "기계와 인간은 서로 잘하는 영역이 다르다"며 "기계는 단순하고 반복적인 일을 잘하고, 인간은 고도의 사고를 바탕으로 각 개별 환자의 상황에 맞는 질문, 환자 상태에 대응하는 일에 특화돼 있는데 문제는 현재 의료기관의 가장 큰 문제점은 의료진이 타이핑 등 반복적이고 단순한 일에 할애하는 시간이 너무 많다는 것"이라고 지적했다.의사가 차트에 환자 상태를 기록하고, 처방을 내리는 행정적 절차에 얽매이다 보니 정작 환자의 눈을 마주보며 대화하고 개별 환자에 적합한 의료적 상담을 제공할 여유가 없다는 것. 간호사들 역시 바이탈 사인 체크, 환자 안내 등의 반복적인 업무 비중이 높아 의료진의 '기계적인 대응'이 나올 수 밖에 없다는 진단이다.조치흠 대한의료정보학회 조직위원장조 위원장은 "병원에 처음 온 환자, 특정 질병을 첫 진단 받은 환자는 어디로 가서, 어떤 절차로 약을 처방받는지, 질병에 대한 올바른 접근법은 뭔지, 발병 원인은 무엇인지 질문이 꼬리에 꼬리를 문다"며 "의료진들이 이에 적절히 대응하고 싶지만 행정적 절차가 너무 많아 다 대응할 수 없는 아쉬움이 있다"고 밝혔다.그는 "내년 10월을 목표로 문진 시스템과 ChatGPT의 접목을 시도하고 있다"며 "ChatGPT는 실시간 언어 모델이기 때문에 어르신들이 어려워하는 키오스크와 달리 진입 장벽없이 환자가 대화로 물어봐도 인간과 유사한 수준으로 답변을 해 준다"고 강조했다.이어 "음성 기반의 EMR이 상용화되고 있기 때문에 곧 고도화된 보이스 EMR이 병의원의 필수 시스템으로 자리잡지 않을까 한다"며 "ChatGPT와 연동까지 된다면 상당량의 의료 행정 업무에서 해방돼 타이핑을 치느라 환자 눈을 볼 시간도 없는 의료진이 보다 환자 진료에 집중할 수 있게 될 것"으로 전망했다.이는 "의사나 간호사가 바쁜 상황에서 ChatGPT는 환자들에게 의료 기록과 관련된 질문에 응답하거나 증상에 대한 일반적인 정보를 제공할 수 있다"는 ChatGPT의 답변과 같다. 최고의 의료와 최첨단 스마트 플랫폼, 그리고 AI가 융합된 스마트병원은 효율성을 기반으로 오히려 인술을 펼치기 위한 따뜻한 교감이 가능해진다는 것.스마트화를 통해 의료진들이 본인 역량을 환자에게 더욱 집중할 수 있도록 구조화하는 것이 사람과 사람이 교감하는 환자 중심의 감성병원으로 발전하는 핵심이기 때문에 행정 업무의 효율화 방향으로 ChatGPT의 우선 접목시도가 이뤄질 것이라는 게 그의 판단이다.실제로 의료정보학회는 올해 춘계학술대회 주제로 'Revolution and Innovation in Smart Healthcare'를 선정, ▲ChatGPT 초보자를 위한 연구 활용법 ▲의료정보/인공지능의 임상적용 ▲의료영상 인공지능 ▲머신러닝 기술 개발 및 적용 ▲초거대 AI의 의료분야 적용방안 ▲의료인공지능의 미래를 위한 인재양성 방안 ▲의료분야에서의 자연어처리 및 ChatGPT 기술의 적용과 미래 전망 ▲Vision 기반 Medical AI 기술과 초거대 AI로 인한 변화 방향 등의 세션을 전진배치헸다.▲접목 시도는 현재진행형…"행정 업무 효율화에 최적"김종엽 건양대의료원 교수(이비인후과)는 의료계에서 '데이터사이언티스트'로 꼽힌다. 프로그래밍 언어 습득을 기반으로 아이폰 앱을 개발한 것은 물론 건양대 헬스케어데이터사이언스센터장, 의료정보부실장으로 활동하며 기술이 가져올 의학계의 변화를 조망하고 있다.보건복지부와 데이터 네트워크 인공지능 중장기 국가전략 및 실행계획을 수립하고, 대통령 직속 4차산업혁명위원회에서 디지털 헬스케어 특별위원회 위원을 맡는 등 의료인공지능 발전과 인프라 조성에 노력한 공로로 작년 '과학·정보통신의 날'에 국무총리 표창을 받은 바 있다. 그가 판단한 ChatGPT는 의료진의 궂은일을 떠앉는 조력자다.김 교수는 "의료진을 포함해서 미디어, 제약사, 의료기기업체, 보건당국까지 의료 현장에서 어떻게 ChatGPT를 접목하고 활용할 수 있냐는 질문이 빈번하게 나온다"며 "현재 ChatGPT는 의료쪽에 특화된 모델은 아니기 때문에 추가 학습을 시켜 적절한 튜닝을 하면 기능이 올라간다"고 강조했다.임상 의료기관과 ChatGPT의 접목을 시도하는 전문가들은 대화형 인공지능의 활용이 문진 및 의료 데이터 요약 등 행정 업무 효율화를 위주로 점차 확대될 것으로 전망했다.(자료사진)그는 "현재 모델에 병원 데이터가 합쳐지면 ChatGPT의 궁극의 장점으로 꼽히는 문헌 검색과 요약에서 굉장한 힘을 발휘할 것으로 본다"며 "각 대형 의료기관마다 의무기록이 쌓여서 특정 정보를 찾는게 힘든데 이제 그런 수고를 언어 모델인 ChatGPT가 대신하지 않을까 한다"고 전망했다.그는 "포탈 사이트에서 만든 음성 인식 앱이 높은 인식률을 기반으로 많이 쓰이고 있는데 이를 텍스트 입력 기반의 ChatGPT와 결합하면 굉장한 시너지가 예상된다"며 "이를 테면 환자와 의사의 대화를 ChatGPT가 듣고 기록한 후 여기에서 처방 데이터를 추출해서 자동으로 처방전을 만들어주는 상황을 그려볼 수 있다"고 설명했다.음성 기반의 ChatGPT가 상용화된다면 의료진은 텍스트 기반의 데이터 확인, 생성에 시간을 아낄 수 있어 환자 진료에 보다 집중할 수 있게 된다는 것. 이 역시 "의료(연구)에는 방대한 양의 데이터와 문헌 조사가 필요한데, ChatGPT는 이러한 작업을 자동화하거나 보조할 수 있다. 예를 들어 ChatGPT는 의료 문헌을 분석하고 연구 결과를 요약하거나 관련 연구 자료를 추천할 수 있다"는 ChatGPT의 언급과 일치한다.건양대병원은 이런 장점을 근거로 의료기관 행정 효율화 영역에서 ChatGPT 도입 여부를 검토중이다.김 교수는 "ChatGPT를 도입해 의료기관에 적합하게 파인 튜닝(fine tunning)할지, 아니면 자체 개발할지 고민하고 있다"며 "인공지능이라고 해도 요즘은 오픈소스 방식이 많아 자체 개발도 가능한 수준"이라고 말했다.그는 "문진 과정에서 환자의 관심 키워드를 자동으로 포착해 의료진에게 전달하는 문진과 의무기록이 합쳐진 방식을 고려하고 있다"며 "기존의 상용화된 보이스 EMR 등의 솔루션은 생각보다 기대에 못 미쳐 활용도가 떨어졌지만 대규모 언어 모델 인공지능은 맥락을 이해하고 요약하는 능력이 강력해, 심도있게 도입 방안을 고민하고 있다"고 덧붙였다.▲거짓말에 능숙한 인공지능…의료 영역 활용 위한 과제는?긍정론에도 불구하고 메타버스와 같이 한때의 유행이나 제한적 활용에 그칠 것이란 전망도 나온다.학습 데이터를 기반으로 하는 만큼 얼마나 양질의 데이터를 제공하고 학습시키느냐가 의료적 활용도를 결정하고 부정확한 정보를 능숙한 거짓말로 만들어내는 환각(hallucination) 특성상 행정 영역에서 제한적 활용만 가능할 것이란 진단이다. 환자 생명에 직결된 내용을 잘못 고지할 경우 이를 활용한 의료진, 의료기관의 책임소재 문제도 불거질 수밖에 없기 때문이다.언어 모델 인공지능은 그 특성답게 환자 안내, 문진, 의료 정보 취합, 환자 상담 요약에 강점이 있어 진단 영역에서는 진단에 특화된 전문 인공지능이 사용될 것이라는 것. ChatGPT가 모든 의료적 문제를 해결하는 '만능 키'가 아니라는 뜻이다.김대진 가톨릭중앙의료원 정보융합진흥원장(서울성모병원 정신건강의학과 교수)은 "처음엔 메타버스 회의가 신기해서 많이 시도됐지만 지금은 자취를 감췄다"며 "ChatGPT가 그런 전철을 밟을 것인지에 대해선 회의적"이라고 말했다.그는 "ChatGPT의 등장은 고작 반년을 지났기 때문에 현 시점에서 상용화를 진단하는 것은 성급하지만 우선은 ChatGPT는 언어에 강점이 있어 활용성은 언어 모델 위주로 판단해야 할 것 같다"며 "마이크로소프트가 음성 인식 헬스케어업체 뉘앙스(Nuance)를 인수하고 ChatGPT를 결합하는 등 의료 영역 고도화에 나섰다"고 밝혔다.김대진 가톨릭중앙의료원 정보융합진흥원장그는 "뉘앙스 AI에 환자와 정신과 의사의 대화를 들려준 뒤 무슨 약을 써야 하는지, 치료 스케쥴을 어떻게 해야 하는지 계획을 짜 달라고 하자 전문가가 보기에도 굉장히 수준 높은 답변이 나왔다"며 "메타버스는 실용성이 떨어져 없어도 그만이었지만 ChatGPT는 다르다"고 강조했다.검진 데이터를 ChatGPT가 요약해 준다면 전문의가 같은 시간 동안 더 많은 데이터를 읽고 판독해 더 많은 검진 결과를 산출해 내는 등 실제 업무 효율화에 기여할 수 있다는 것.김대진 원장은 "로봇수술할 때 화면을 3D로 구현해 주는 프로그램이나 영상의학 판독에 특화된 AI 등 각 과 특성에 맞는 AI 분석 모델을 구입해달라고 한다"며 "이런 개별화된 솔루션과 ChatGPT를 합치면 업무 효율과를 기대할 수 있다"고 전망했다.그는 "ChatGPT를 만능으로 본다면 실망하겠지만 각 유틸리티를 연결하는 통로로 본다면 활용성은 무궁무진하다"며 "딥러닝 모델과 연계해 심혈관 질환 급성사망 확률이 70% 이상일 때 약을 미리 처방하게끔 한다든지 활용 방안이 많다"고 덧붙였다.어디까지나 의료진의 업무 효율 증대 목적에 ChatGPT의 활용성이 있는 만큼 이를 너무 경계하거나 확대해석할 필요가 없다는 것. AI의 활용성과 확장성은 결국 이를 이용하고 소비하는 의료인의 손에 달려있다는 뜻이다.아주대의대 병리학교실 김석휘 교수가 진행한 ChatGPT의 의사 인력 대체 가능성을 점검한 연구 논문(doi.org/10.3904/kjm.2023.98.3.99)은 ChatGPT를 의료진의 의사 결정을 돕는 유틸리티로 봤을 뿐 의사를 대체할 '적'으로 보진 않았다.김 교수는 "미충족 수요가 너무 높고 의사가 수행하는 것이 불가능한 일이라면, 해당 영역에서 AI를 활용할 수 있다"며 "예를 들어 전혈구 계산은 임상적 주요 결정에 꼭 필요하지만 사람이 세기 어렵기 때문에 기계의 힘을 빌려 정확히 셀 수 있고, 이러한 기능이 검증된다면 의사는 그 결과를 믿고 이에 기반해 결정할 수 있다"고 강조했다.그는 "의사가 하기 어렵지만 기계로는 빠르고 정확하게 할 수 있고, 이 결과를 의사가 점검 후 최종 판단을 하는 경우에도 해당 모델은 의사의 역할과 의료의 범주를 더 확장해 주는 것"이라며 "반면에 의사가 어렵지 않게 할 수 있는 일이고, 굳이 다른 방법론의 도움이 필요하지 않다면 수요도가 떨어지기에 진료 현장에 들어오기 어려운 모델이 될 것"이라고 관측했다.이마저도 "ChatGPT는 환자들의 건강 상태를 모니터링하는데 활용될 수 있고 환자들의 건강 데이터와 의료 기록을 분석해 변화나 이상 징후를 감지하고 조기 경보를 제공할 수 있다"는 ChatGPT가 스스로 예측한 활용성과 그 비전을 공유하는 셈이다. 
2023-07-03 05:30:00학술

의료 영역 챗GPT 활용성 찾아라…의학계 검증 착수

메디칼타임즈=최선 기자이용자와 실시간으로 대화가 가능한 대규모 인공지능 모델 ChatGPT(챗GPT)가 미국 의사국시를 통과하면서 의료 영역에서 실제 활용성을 검증하기 위한 작업이 본격화되고 있다.자의식이 없다는 점에서 그릇된 정보의 학습 가능성을 고려하면 엄중한 지식 및 판단이 필요한 의료 영역에서 그 활용성에 제한이 따를 수밖에 없기 때문.다양한 범위에 걸쳐 고품질의 연구 관련 질문을 생성, 연구자에게 참신한 아이디어를 제공하는 사례가 등장한 반면 엉터리 답변을 내놓은 사례도 등장하면서 전문가들은 챗GPT의 검증에 보다 오랜 시간이 필요하다는 데 무게를 실어주고 있다.2022년 11월 공개된 챗GPT는 대화형 인공지능 서비스로 사용자가 입력한 질문에 답하도록 설계된 언어모델이다.의학 논문검색 사이트 PubMed에 챗GPT 관련 연구가 첫 등장한 2022년 12월을 기점으로 총 141건의 논문이 등록됐다. 챗GPT의 등장이 4개월에 불과하다는 점에서 폭발적인 연구 증가는 의학계의 관심도를 나타내는 단면.초기 연구가 챗GPT의 소개 및 의학적 활용성 모색에 그쳤다면 최근 연구는 실제 임상 현장, 환경을 구현해 챗GPT가 적절한 반응을 나타내는지 확인하는 '검증' 영역에 접어들고 있다.의학 논문검색 사이트 PubMed의 챗GPT 관련 연구 등록 현황. 4개월간 141건이 등록됐다.이달 13일 공개된 연구(DOI: 10.1038/s41598-023-31412-2)는 챗GPT가 소화기내과에서 중요한 연구 질문을 도출해낼 수 있는지 평가했다.연구진은 위장병학(GI) 분야는 끊임없이 진화하고 있어 중요한 연구 질문을 정확히 집어내는 것이 중요하다는 점에 착안, 연구 우선순위를 식별하기 위한 평가에 착수했다.GI의 네 가지 핵심 주제인 염증성 대장 질환, 마이크로바이옴, 인공지능, 고급 내시경 등에 대해 챗GPT에 질의하고 경험이 풍부한 소화기 전문의로 구성된 패널이 생성된 연구 질문을 1~5 등급(높을수록 적절)으로 평가했다.전문가 패널의 평가 결과 챗GPT는 관련성이 있고 명확한 연구 질문을 생성했다는 판단이 나왔다.평균적으로 질문의 등급은 3.6±1.4 점이었으며, 관련성, 명확성, 특수성 및 독창성에 대한 평균 등급은 각각 4.9±0.1, 4.6±0.4, 3.1±0.2, 1.5±0.4점이었다. 패널들은 챗GPT가 연구 질문을 생성하는 데 명확하고 적절하지만 독창적이지는 않았다고 판단했다.연구진은 "이번 연구는 대규모 언어 모델이 GI 분야에서 연구 우선 순위를 식별하는 데 유용한 도구가 될 수 있지만 생성된 연구 질문의 참신성을 개선하기 위해 더 많은 작업이 필요하다는 것을 시사한다"고 가능성과 한계를 동시에 진단했다.챗GPT가 핵의학 문헌을 요약하거나 연구자의 글을 수정 및 개선하는 데 도움을 줄 수 있는지 판단한 연구(doi.org/10.1007/s00259-023-06172-w)도 지난달 공개됐다. 이번 연구에서 챗GPT는 다소 실망스런 결과를 내놓았다.연구진은 핵의학 필기 시험을 시뮬레이션하기 위해 챗GPT에게 50개의 4~5선다형 문제를 제공하고 정답 1개를 선택하도록 했다. 50개 사례 모두에서 챗GPT는 명확한 답을 제시했지만 답안과 대조한 결과 정확도는 34%(17/50)에 불과했다.이어 연구진은 문답 피드백 방식으로 챗GPT의 학습 능력 또는 수정 능력을 테스트했다. 틀린 대답을 내놓을 경우 다시 질문하는 방식으로 문제를 이어갔다."뼈 스캔에서 흡수량이 증가하지 않는 양성 병변은 무엇입니까?"라는 질문에 챗GPT는 유골종(osteoid osteoma)이라는 오답을 내놓았다. 다시 질문을 한 결과 이번엔 골관절염이라는 엉뚱한 대답을 내놓았다.연구진은 "같은 질문을 하면 다른 답이 나타날 수 있고 몰랐거나 대답할 수 없다고 말하는 대신 챗GPT는 피상적이고 설득력 있는 답변을 제공했는데 이는 잘못된 것"이라며 "특히 이같은 행위는 스캔 결과를 해석하는 데 해로울 수 있다"고 지적했다.연구진은 "AI 모델은 높은 신뢰도로 잘못된 출력을 생성하기 위해 (답변을) 속일 수 있으며 현재 동료 검토자를 속일 수 있는 겉으로 보기에 설득력 있는 콘텐츠를 제공할 수 있다"며 "이번 예비 분석은 현재 표준화된 시험의 환경에서 챗GPT가 핵의학 의사가 기대하는 지식을 입증하는 것과는 거리가 멀다는 것을 시사한다"고 덧붙였다.이달 4일 공개된 연구(DOI: 10.1007/s†16-023-01925-4)는 임상 실무 지원 및 의약품 연구, 공중보건 주제에 대한 추론에 걸쳐 챗GPT의 가능성을 평가했다.연구진은 챗GPT와 같은 AI 기반 언어 모델이 인상적인 능력을 입증했지만, 높은 수준의 복잡한 사고가 필요한 의료 분야에서 얼마나 기능을 잘 수행할지는 미지수라며 그 타당성을 조사했다.먼저 과학 글쓰기 영역에서 챗GPT에 2022년 12월 NEJM에 발표된 논문 5편을 요약해달라고 한 결과 전반적으로 올바른 결과값을 내놓았다.이어 공중보건에 대한 토픽에서 연구진은 챗GPT에 생물학적 관점에서 고령자의 연령을 객관적으로 측정할 지표를 물었고 이에 챗GPT는 치아 및 골격 발달, 텔로미어 길이, DNA 메틸화, 호르몬 수준, 인지 기능을 포함해 일반적으로 연구되는 방법들의 목록을 즉시 제공했다.연구진은 "챗GPT는 문헌 탐색과 새 연구 가설 수립, 복잡한 데이터 처리에 유용할 수 있다"며 "또 전자 건강 기록(EHR), 임상 노트 및 연구 논문과 같은 의료 텍스트에서 유용한 정보를 추출하는 데도 도움이 될 수 있고 복잡한 연구를 일반 대중이 이해하기 쉬운 언어로 번역함으로써 과학적 발견의 보급을 촉진할 수 있다"고 결론내렸다.이어 "다만 챗GPT의 한계와 능력을 이해해야 한다"며 "정확한 답변은 신뢰할 수 있는 것처럼 들리지만 부정확하거나 비논리적인 언어를 생성하는 챗GPT의 능력도 포함되고, 또 다른 큰 문제는 챗GPT가 훈련 받은 데이터에 존재하는 편견을 재현할 수 있다는 것"이라고 덧붙였다.챗GPT를 연구 강의 자료 생성에 활용해 본 김병욱 대한상부위장관·헬리코박터학회 총무이사 역시 비슷한 의견이다.그는 "챗GPT는 사람들이 기대하는 것처럼 기존의 연구를 토대로 새로운 내용의 임상 논문을 쓰거나 새로운 개념, 아젠다를 제시할 정도의 성능은 아니었다"며 "강의 자료 요약하는 부분에서 활용할 부분이 있다는 생각이 들었을 뿐 챗GPT가 창의적으로 기존 문제들을 해결해 줄 돌파구라는 기대감은 과하다"고 덧붙였다.
2023-03-22 11:53:22학술
  • 1
기간별 검색 부터 까지
섹션별 검색
기자 검색
선택 초기화
이메일 무단수집 거부
메디칼타임즈 홈페이지에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 방법을 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반할 시에는 정보통신망법에 의해 형사 처벌될 수 있습니다.